بهبود عملکردد سیستم های جداسازی سیگنال گفتار دو گوینده در حالت تک میکروفونه
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی برق
- نویسنده محمدحسین رادفر
- استاد راهنما ابوالقاسم صیادیان
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1386
چکیده
در این رساله روش جداسازی سیگنال دو گوینده زمانی که فقط به سیگنال مخلوط دریافت شده از یک میکروفون دسترسی داریم مورد بررسی قرار می گیرد. یطور کلی روش های جداسازی سیگنال در حالت تک میکروفونه به دو گروه تقسیم می شوند: گروه اول روش های را شامل می شود که اصول حاکم بر سیستم شنوایی انسان را برای جداسازی دنبال می کنند و گروه دوم روش های که با استفاده از اطلاعات قبلی از دو گوینده سیگنال مخلوط را مدل می کنند. هدف اصلی این رساله یوشش نقاط ضعف روش های موجود است. برای این منظور چهار راه حل ارایه می گردد: (1) ترکیب روش های گروه اول و دوم. این روش علاوه بر اینکه مزایای هر دو روش را حفظ می کند مستقل از گوینده ها می باشد. (2) الگوریتمی برای تخمین فرکانس های اصلی دو گوینده زمانی که فقط به سیگنال مخلوط دسترسی داریم ارایه می شود. فرکانس های اصلی دو گوینده به عنوان ویژگی متمایز کننده دو گوینده در گروه اول کاربرد دارند. (3) روش تعمیم یا فته ای برای روش های مدل سازی وابسته به گوینده بر اساس شناسایی گوینده ها از سیگنال مخلوط ارایه می شود. به این ترتیب می توان روش های وابسته به گوینده را به تعداد نامحدودی از گوینده ها تعمیم داد. (4) براساس روش تخمین کمینه کردن متوسط مربعات خطا فیلتر جدیدی بنام ماسک نرم برای جداسازی سیگنال دو گوینده ارایه می شود. علاوه بر ارایه روش های جدید جداسازی در این رساله دو تقریب بنام های تقریب ماکزیمم-مخلوط و ماسک دودویی که در روش های جداسازی کاربرد فراوانی دارند مورد تحلیل قرارگرفته و با استفاده ازروش های ریاضی اثبات می شوند. اهمیت این تحلیل ها از آن جهت که دیدگاه جدیدی با مستدلات ریاضی برای ابزارهایی که به مدت 20 سال بصورت تجربی مورد استفاده قرار می گرفته ارایه می شود.
منابع مشابه
بهبود روشهای مبتنی بر مدل، جهت جداسازی سیگنالهای موزیک و گوینده، از سیگنال ترکیبی تک میکروفونه
در این پایان نامه روشهای جداسازی سیگنالهای گوینده و موزیک، زمانی که فقط به سیگنال مخلوط دریافت شده از یک میکروفون دسترسی داریم مورد بررسی قرار می گیرد. بطور کلی روشهای جداسازی سیگنال در حالت تک میکروفونه به دو گروه تقسیم می شود : گروه اول روش هایی را شامل می شوند که اصول حاکم بر سیستم شنوایی را برای جداسازی انتخاب می کنند و گروه دوم روش هایی که با استفاده از اطلاعات قبلی از دو منبع، جداسازی را ...
15 صفحه اولتشخیص حالت احساسی از سیگنال گفتار در حالت مستقل از گوینده با استفاده از آنتروپی بسته موجک
در این مقاله آنتروپی بسته موجک برای بازشناسی احساسات از گفتار در حالت مستقل از گوینده پیشنهاد شده است. پس از پیشپردازش، بسته موجکِ db3 سطح 4 در هر فریم محاسبه شده است و آنتروپی شانون در گرههای آن به عنوان ویژگی در نظر گرفته شده است. ضمناً ویژگیهای نواییِ گفتار شامل فرکانس چهار فرمنت اول، جیتر یا دامنه تغییرات فرکانس گام و شیمر یا دامنه تغییرات انرژی به عنوان ویژگیهای پرکاربرد در حوزه تشخیص احس...
متن کاملتشخیص حالت احساسی از سیگنال گفتار در حالت مستقل از گوینده با استفاده از آنتروپی بسته موجک
در این مقاله آنتروپی بسته موجک برای بازشناسی احساسات از گفتار در حالت مستقل از گوینده پیشنهاد شده است. پس از پیشپردازش، بسته موجکِ db3 سطح 4 در هر فریم محاسبه شده است و آنتروپی شانون در گرههای آن به عنوان ویژگی در نظر گرفته شده است. ضمناً ویژگیهای نواییِ گفتار شامل فرکانس چهار فرمنت اول، جیتر یا دامنه تغییرات فرکانس گام و شیمر یا دامنه تغییرات انرژی به عنوان ویژگیهای پرکاربرد در حوزه تشخیص احس...
متن کاملمعرّفی الگوریتم جدید DESICA برای جداسازی کور سیگنال منابع گفتار در حالت پویا
Abstract: We consider a new scenario in blind speech separation problem in which the number and the features of active sources change with time in opposite to the previous methods in which all sources are active all the time. Accordingly, we propose the new DESICA algorithm for source separation which is a compound of the ICA and DESPRIT algorithms. In this algorithm, using the ICA, the separat...
متن کاملتشخیص حالت احساسی از سیگنال گفتار در حالت مستقل از گوینده با استفاده از آنتروپی بسته موجک
در این مقاله آنتروپی بسته موجک برای بازشناسی احساسات از گفتار در حالت مستقل از گوینده پیشنهاد شده است. پس از پیش پردازش، بسته موجکِ db3 سطح 4 در هر فریم محاسبه شده است و آنتروپی شانون در گره های آن به عنوان ویژگی در نظر گرفته شده است. ضمناً ویژگی های نواییِ گفتار شامل فرکانس چهار فرمنت اول، جیتر یا دامنه تغییرات فرکانس گام و شیمر یا دامنه تغییرات انرژی به عنوان ویژگی های پرکاربرد در حوزه تشخیص احس...
متن کاملجداسازی سیگنال صحبت بر پایه ica برای بهبود کیفیت گفتار
تاکنون انواع مختلفی از تکنیک های بهبود گفتار مورد مطالعه قرار گرفته اند. از آنجایی که نویزهای متنوعی در محیط وجود دارند، هیچ یک از تکنیک های بهبود گفتار برای حذف همه انواع نویز مناسب نیستند. علاوه بر نویز پس زمینه در محیط، وجود سیگنال های تداخلی صحبت و همچنین انعکاس-های محیط، مسئله بهبود گفتار را پیچیده تر می کند و لزوم الگوریتم های حذف پژواک و تفکیک منابع را برای این منظور فراهم می آورد. اخیراً...
15 صفحه اولمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی برق
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023